In [1]:
import plotly.graph_objs as go
import plotly.express as px
import pandas as pd

Sociale media versus mentale gezondheid¶

Naam: Chen Lei Cha, Lex Mulder, Simon Bosch
Studentnummer: 14629127, 13980521, 13882171
Groepnummer: D3
Github repository: https://github.com/Sunglasses246/InfoVis-2023

Introductie¶

Sociale media hebben een grote impact op de wereld achtergelaten, sinds het begin van de 21e eeuw is er een nieuwe manier van leven ontstaan: het digitale leven. Mensen van over de hele wereld kunnen nu in real time delen wat zij doen, en hoe hun leven eruitziet. Wat in eerste instantie een hele handige uitvinding bleek te zijn, brengt echter meerdere perspectieven met zich mee. Al snel bleek namelijk dat je niet per se alle kanten van je leven op sociale media hoeft te zetten.

In ons onderzoek gaan we kijken naar de impact van deze sociale media op de mentale gezondheid onder jongvolwassenen. Sociale media zouden namelijk een negatief zelfbeeld kunnen veroorzaken bij jongvolwassenen. Wij waren benieuwd of er een correlatie te vinden viel tussen de mentale gezondheid en de opkomst van sociale media.

Sociale media creëren namelijk ook kansen op zowel sociaal- als werkgebied, nog nooit eerder konden jongeren zo snel met elkaar communiceren. Het zorgt namelijk ook voor kansen op het gebied van liefde, vriendschap en werk. Jongvolwassenen kunnen ook veel gemakkelijker mensen vinden die dezelfde interesses delen, en hierdoor juist dat buitengesloten gevoel tegengaan.

Kortom gezegd, er zijn meerdere perspectieven die in eerste instantie erg logisch lijken te zijn. Hierom zijn wij benieuwd wat de data te zeggen heeft.

Perspectieven en argumenten¶

Perspectief 1: Sociale media heeft een negatieve impact op het mentale welzijn¶

Argument 1: Tevredenheid en geluk nemen af¶

Het gebruik van sociale media kent zowel positieve als negatieve eigenschappen. Vele onderzoeken hebben geconstateerd dat er inderdaad een connectie bestaat tussen het gebruik van sociale media en mentale gezondheidsproblemen (Keles et al., 2019). Een voorbeeld van actie op sociale media die vaak leidt tot een verlaging van geluk is het vergelijken van de een met de ander. Volgens Krayer, Ingledew, & Iphofen, (2008) en Myers & Crowther (2009) komt dit vaker voor bij adolescenten dan bij jonge kinderen en volwassenen.
        Dit is terug te zien in de data. In de onderste twee visualisaties is er een daling te constateren van de percentages van geluk. Het is op te merken dat de leeftijdscategorie van 18 tot 25 de sterkste afname kent op de gebieden van tevredenheid en geluk. De tweede visualisatie ondersteunt deze motie. In deze visualisatie is te zien dat geluk onder jongvolwassenen tussen 2019 en 2021 flink afgedaald is. Sterker nog, 2021 markeert het laagste percentage van geluk in 24 jaar. Bovendien is het gebruik van sociale media in recente jaren hoger dan het geluk percentage.

In [2]:
gl = pd.read_csv('10-Copy1.1.1-geluk-en-tevredenheid.csv')
In [3]:
trace1 = go.Scatter(x = gl['Category'], 
                    y = gl['Tevredenheid, 18 jaar of ouder'], 
                    mode = 'lines + markers', 
                    name = 'Tevredenheid, 18 jaar of ouder', 
                    marker = dict(color = 'lightblue'))
trace2 = go.Scatter(x = gl['Category'], 
                    y = gl['Tevredenheid, 18 tot 25 jaar'], 
                    mode = 'lines + markers', 
                    name = 'Tevredenheid, 18 tot 25 jaar',
                   marker = dict(color = 'blue'))
trace3 = go.Scatter(x = gl['Category'], 
                    y = gl['Geluk, 18 tot 25 jaar'], 
                    mode = 'lines + markers', 
                    name = 'Geluk, 18 tot 25 jaar',
                   marker = dict(color = 'green'))
trace4 = go.Scatter(x = gl['Category'], 
                    y = gl['Geluk, 18 jaar of ouder'], 
                    mode = 'lines + markers', 
                    name = 'Geluk, 18 jaar of ouder',
                   marker = dict(color = 'lightgreen'))

Layout = go.Layout(title = 'Tevredenheid en geluk',
                  xaxis = dict(title = 'Jaren', gridcolor = 'lightgrey'),
                  yaxis = dict(title = 'Percentage mensen dat zich zo voelt', tickformat = ',.0%', range = [0.7, 1], gridcolor = 'lightgrey'),
                   font = dict(family = 'Georgia', color = 'Black'),
                   plot_bgcolor = 'white',
                   paper_bgcolor = 'white',
    )
                  

fig = go.Figure(data = [trace1, trace2, trace4, trace3], layout = Layout)
fig.update_layout(
    xaxis=dict(
        rangeselector=dict(
            buttons=list([
                dict(count=1,
                     label="1y",
                     step="year",
                     stepmode="backward"),
                dict(count=5,
                     label="5y",
                     step="year",
                     stepmode="backward"),
                dict(step="all")
            ])
        ),
        rangeslider=dict(
            visible=True
        ),
        type="date"
    )
)

fig.add_annotation(
    xref="paper", yref="paper",
    x=0.5, y=-0.57,
    text="Op de x-axis is de tijd in jaren te zien. Op de y-axis is het percentage vanaf 70% mensen dat zich tevreden of gelukkig voelt te zien. <br> In deze lijngrafiek is te zien dat zowel het geluks- als tevredenheidsgevoel afnemen.",
    showarrow=False,
)
    
fig.show()
In [4]:
cr = pd.read_csv('correlatie-Copy1.csv')
cr_filtered = cr.dropna()
cr_filtered = cr_filtered.sort_values(by='Category', ascending=False)
In [5]:
data = [
    go.Bar(x = cr['Category'],
          y = cr['18-29'],
          name = 'Gebruik van sociale media door jongvolwassenen',
          legendgroup = 'Gebruik van sociale media door jongvolwassenen',
          marker = dict(color = '#147db1')
          ),
    go.Bar(x = cr['Category'],
          y = cr['Geluk, 18 tot 25 jaar'],
          name = 'Geluk jongvolwassenen',
          legendgroup = 'Geluk jongvolwassenen',
          marker = dict(color = '#3a4f6d')
          )
]

x_layout = go.Layout(title = 'Geluk vs sociale media gebruik van jongvolwassenen door de jaren heen',
                    xaxis = dict(title = 'Jaren', 
                                gridcolor = 'lightgray'
                                ),
                    yaxis = dict(title = 'Percentage mensen', 
                                 tickformat = ',.0%',
                                range = [0, 1],
                                gridcolor = 'lightgray'),
                    font = dict(family = 'Georgia', 
                                color = 'Black'),
                    plot_bgcolor = 'white',
                    paper_bgcolor = 'white' 
                    )

x_figure = go.Figure(data = data, layout = x_layout)

x_figure.update_layout(
    xaxis=dict(
        rangeselector=dict(
            buttons=list([
                dict(count=1,
                     label="1y",
                     step="year",
                     stepmode="backward"),
                dict(count=5,
                     label="5y",
                     step="year",
                     stepmode="backward"),
                dict(step="all")
            ])
        ),
        rangeslider=dict(
            visible=True
        ),
        type="date"
    )
)
    
x_figure.add_annotation(
    xref="paper", yref="paper",
    x=0.5, y=-0.57,
    text="Op de x-axis is de tijd in jaren te zien. Op de y-axis is het aantal jongvolwassenen dat zich gelukkig voelt of sociale media gebruikt te zien<br> in percentages. In deze grafiek is te zien dat naarmate sociale media meer wordt gebruikt, het geluksgevoel afneemt.",
    showarrow=False,
)
    
x_figure.show()

Argument 2: FOMO (fear of missing out)¶

Een ander negatief resultaat van het gebruik van sociale media heet ‘Fear Of Missing Out’ (FOMO). FOMO bestaat uit twee onderdelen. Het eerste onderdeel is het waarnemen dat anderen leuke en waardevolle ervaringen meemaken, waarbij je afwezig bent. Dit is meestal de voorloper op mentale gezondheidsproblemen. Het andere onderdeel bestaat uit de wil om met anderen verbonden te blijven. Dit wordt beschouwd als het hulpmiddel tegen de mentale gezondheidsproblemen (Elhai et al., 2021). Om ervoor te zorgen dat je met anderen verbonden blijft, is het vaak vereist om voortdurend je sociale media bij te houden. Hierdoor wordt het gebruik van sociale media verhoogd, wat eventueel kan leiden tot verslaving.
        Dit is terug te zien in de visualisatie. Het gebruik van sociale media is verhoogd door de jaren heen.

In [6]:
dc = pd.read_csv('social-Copy1.csv')
dc['Year'] = pd.to_datetime(dc['Year'])
In [7]:
trace1 = go.Scatter(x = dc['Year'],
                   y = dc['18-29'],
                   name = '18-29',
                   mode = 'lines + markers',
                   marker = dict(color = 'darkblue')
                   )

trace2 = go.Scatter(x = dc['Year'],
                   y = dc['30-49'],
                   name = '30-49',
                   mode = 'lines + markers',
                   marker = dict(color = 'mediumblue')
                   )

trace3 = go.Scatter(x = dc['Year'],
                   y = dc['50-64'],
                   name = '50-64',
                   mode = 'lines + markers',
                   marker = dict(color = 'blue')
                   )

trace4 = go.Scatter(x = dc['Year'],
                   y = dc['65+'],
                   name = '65+',
                   mode = 'lines + markers',
                   marker = dict(color = 'steelblue')
                   )

social_layout = go.Layout(title = 'Sociale media gebruik per leeftijdsgroep in de Verenigde Staten',
                          xaxis = dict(title = 'Jaren', gridcolor = 'lightgray'),
                         yaxis = dict(title = 'Percentage mensen', tickformat = ',.0%', range = [0, 1], gridcolor = 'lightgray'),
                         font = dict(family = 'Georgia', color = 'Black'),
                        plot_bgcolor = 'white',
                       paper_bgcolor = 'white' 
                         )

social_figure = go.Figure(data = [trace1, trace2, trace3, trace4], layout = social_layout)

social_figure.add_annotation(
    xref="paper", yref="paper",
    x=0.5, y=-0.21,
    text="Op de x-axis is de tijd in jaren te zien. Op de y-axis is, per leeftijdsgroep, het percentage mensen die sociale media gebruiken te zien. <br> Uit deze grafiek is af te lezen dat bij elke leeftijdsgroep het sociale media gebruik is toegenomen.",
    showarrow=False,
)

social_figure.show()

Argument 3: Online daten heeft een negatieve impact¶

In 2013 kwam Tinder met een revolutionaire manier van daten, het swipe-model. In een onlineonderzoek van BMC Psychology (Holtzhausen et al. (2020)), is gebleken dat dit model (SwipedBasedDatingApp) zowel angst en stress levels verhoogt bij gebruikers. De data zijn op basis van de Kessler Psychological Distress Scale onderverdeelt in waardes voor de stresslevels. Voor de angst waarde is hetzelfde gedaan maar dan met de Generalised Anxiety Disorder-2 scale. Hieruit is gebleken dat deze gebruikers een hoger stress/angst niveau hadden dan niet gebruikers.

Zoals de zien in de BusinessofApps dataset is het aantal gebruikers van datingsapps zwaar gestegen. Met een groei van meer dan 130 miljoen actieve gebruikers over de tijdspan van 7 jaar, is te zien hoe de datingsapps razend populair zijn geworden. Als we nu terugkijken naar de algemene tevredenheid en geluk onder jongvolwassenen, valt er dus wel degelijk te concluderen dat deze grote groei van datingsapps bijdraagt aan de verlaging van algemeen geluk.

In [8]:
app = pd.read_csv('datingapp.csv')
In [9]:
datingapp = go.Figure(data=[go.Bar(x=app['Jaar'], y=app['Gebruikers(mm)'], marker_color='red')])

datingapp.update_layout(
    title='Globale dating app gebruikers 2015 tot 2022 (in miljoenen)',
    xaxis = dict(gridcolor = 'lightgray'),
    yaxis = dict(gridcolor = 'lightgray'),
    xaxis_title='Jaar',
    yaxis_title='Gebruikers (mm)',
    plot_bgcolor='white',
    paper_bgcolor = 'white',
    font = dict(family = 'Georgia', color = 'Black')
)

datingapp.add_annotation(
    xref="paper", yref="paper",
    x=0.5, y=-0.22,
    text="De staafdiagram laat duidelijk zien hoe er jaarlijks miljoenen actieve gebruikers bij komen, de dataset begint in 2015 en eindigt in 2022. <br> Op de x-axis staan de jaartallen, op de y-axis staat het aantal wereldweide gebruikers van datingapps (in miljoenen).",
    showarrow=False,
)

datingapp.show()

Argument 4: Cyberbullying¶

Een ander nadeel van de opkomst van sociale media is de toename van cyberbullying. Met behulp van onder andere sociaal media kunnen er bijvoorbeeld leugens of beledigende en bedreigende berichten verzonden worden. Cyberbullying wordt vaak gelinkt met het gebruik van sociale media (Garett et al., 2016). Gevolgen van cyberbullying zijn vaak mentale problemen, gedragsproblemen en in sommige gevallen kan ook zelfmoord het resultaat zijn. In de visualisatie is een wereldkaart te zien met een aantal ingekleurde landen. Met de visualisatie is te zien dat veel landen meer donker zijn geworden door de jaren heen. Dit betekent dat cyberbullying is gestegen, wat een probleem vormt voor de gezondheid van jongeren.

In [10]:
bully = pd.read_csv('bully.csv')

worldmap1 = go.Choropleth(
    locations = bully['Code'],
    z = bully['2018'],
    text = bully['Country'],
    colorscale = "Reds",
    colorbar_title="% Kinderen die<br>cyberbullying ervaren")

worldmap3 = go.Choropleth(
    locations = bully['Code'],
    z = bully['2011'],
    text = bully['Country'],
    visible=False,
    colorscale = "Reds",
    colorbar_title="% Kinderen die<br>cyberbullying ervaren"
)

maplayout = go.Layout(
    title = 'Cyberbullying over de wereld door de jaren heen',
    font = dict(family = 'Georgia', color = 'Black'),
    plot_bgcolor = 'white',
    paper_bgcolor = 'white')

worldmap1_layout = dict(title='2018')

kaart = go.Figure(data = [worldmap1, worldmap3], layout=maplayout)

kaart.update_layout(
    updatemenus=[
        dict(
            type = "buttons",
            direction = "left",
            buttons=list([
                dict(
                    args=[{'visible': [False,True]}],
                    label="2011",
                    method="update"
                ),
                dict(
                    args=[{'visible': [True,False]}],
                    label="2018",
                    method="update")
            ],
            ),
            pad={"r": 10, "t": 10},
            showactive=True,
            x=0.11,
            xanchor="right",
            y=1.1,
            yanchor="top"
        ),
    ]
    
)

kaart.add_annotation(
    xref="paper", yref="paper",
    x=0.5, y=-0.15,
    text="Aan de rechterkant van de kaart staat een meter die een kleur linkt aan het percentage van cyberbullying. Des te roder, des te meer cyberbullying.<br> De kaart is uitgebeeld als wereldkaart. Linksbovenin staan twee knoppen waarmee je naar de kaart van 2011 en 2018 kan kijken.<br> Op de twee verschillende kaarten is te zien dat cyberbullying over de hele wereld is toegenomen tussen 2011 en 2018.",
    showarrow=False,
)

kaart.show()

Perspectief 2: Sociale media heeft een positieve impact op het menselijk welzijn¶

Argument 1: Toename werkgelegenheid¶

Sociale media zijn door de grote stijging in populariteit ook een groot werkgebied geworden. Voor zowel directe banen bij de bedrijven zelf, als gebruik van de platformen voor marketing doeleinden. Deze spontane digitalisering biedt een hele nieuwe dimensie aan werkgelegenheid, en dit is dan ook duidelijk te zien in de grafiek. Zo is te zien hoe vanaf 2014 het aantal banen vrijwel alleen maar stijgt.

Het is logisch te beredeneren dat een tekort aan werkgelegenheid een negatief impact zal achterlaten op de mentale gezondheid van jongvolwassenen, die precies op het punt staan te beginnen aan hun carrière. Uit het onderzoek van Sheldon et al. (2009) is gebleken dat het hebben van een doel, in dit geval een carrière, een aanzienlijk effect heeft op de mentale gezondheid van een mens. Er is dus wel degelijk een correlatie tussen de opbouwende werkgelegenheid en mentale gezondheid onder jongeren. Het algemeen welzijn van jongvolwassenen zal hierom positief beïnvloed worden door de nieuwe werkgelegenheid, het is alleen de vraag of dit kan afwegen tegen de negatieve effecten van sociale media.

In [11]:
werk = pd.read_csv('plswerk.csv', sep = ';')
In [12]:
start_year = 2014
end_year = 2021
selected_data = werk[(werk['Perioden'] >= start_year) & (werk['Perioden'] <= end_year)]

werkd = go.Scatter(x = selected_data['Perioden'], 
                   y = selected_data['TotaalBanen_1'],
                   marker = dict(color = '#3a4f6d'))

werklayout = go.Layout(
    title = 'Groei aantal banen Nederland 2014 - 2021',
    xaxis = dict(title = 'Tijd in jaren', gridcolor = 'lightgray'),
    yaxis = dict(title = 'Aantal banen x1000', gridcolor = 'lightgray'),
    paper_bgcolor = 'white',
    plot_bgcolor = 'white',
    font = dict(family = 'Georgia', color = 'Black')
)

werkfigure = go.Figure(data=werkd, layout=werklayout)

werkfigure.add_annotation(
    xref = "paper", yref = "paper",
    x = 0.5, y = -0.215,
    text = "Op de x-axis is de tijd in jaren te zien. Op de y-axis is het aantal banen te zien. Dit getal moet met 1000 vermenigvuldigd worden om op het daadwerkelijke<br> getal uit te komen. Uit de grafiek is af te leiden dat het aantal banen tussen 2014 en 2021 is toegenomen.",
    showarrow = False,
)

werkfigure.show()

Argument 2: Connectie, educatie en entertainment¶

Diverse sociale media bieden elk verschillende soorten functies aan. Deze functies kunnen voordelig zijn voor de gebruiker. Neem bijvoorbeeld YouTube. YouTube maakt het mogelijk om gemakkelijk video’s openbaar te delen. Deze kunnen variëren van entertainment tot educatie. Het educatieve gedeelte van YouTube kan een groot voordeel bieden. Volgens Kohler en Dietrich (2021) zijn educatieve video’s een goede toevoeging aan de leerstof en het leerprogramma.
        Een ander voordeel van het gebruik van sociale media is de connectiviteit. Sociale media-applicaties zoals Facebook, Instagram en LinkedIn maken het mogelijk om makkelijk en efficiënt met anderen in contact te komen. Het geeft tevens de mogelijkheid om nieuwe connecties te vormen. Contact hebben met anderen, ofwel ‘networking’, kent een aantal voordelen, met betrekking tot de loopbaan. Uit een onderzoek van Davis et al. (2020) werd duidelijk dat het gebruik van LinkedIn voordelen biedt ten opzichte van ‘networking’. Denk hierbij aan ‘sneller werk afronden’, ‘het leveren van emotionele steun’ en ‘het vinden van een nieuwe baan’.
        In de visualisatie hieronder is er een stijging in het gebruik van verschillende soorten media. Aan deze toename kan er gesteld worden dat meer mensen de positieve aspecten van de sociale media ervaren.

In [13]:
df = pd.read_csv('test-Copy1.csv')
df[df.columns[1:]] = df[df.columns[1:]].replace('%', '', regex=True).astype(float) / 100
df['Year'] = pd.to_datetime(df['Year'])
df_filtered = df.dropna()
df_filtered = df_filtered.sort_values(by='Year', ascending=False)
In [14]:
trace1 = go.Scatter(x = df['Year'], 
                    y = df['Facebook'], 
                    mode = 'lines + markers', 
                    name = 'Facebook', 
                    marker = dict(color = 'blue'),
                   connectgaps=True)
trace2 = go.Scatter(x = df['Year'], 
                    y = df['Pinterest'], 
                    mode = 'lines + markers', 
                    name = 'Pinterest', 
                    marker = dict(color = '#FF6F6F'),
                   connectgaps=True)
trace3 = go.Scatter(x = df['Year'], 
                    y = df['Instagram'], 
                    mode = 'lines + markers', 
                    name = 'Instagram', 
                    marker = dict(color = 'pink'),
                   connectgaps=True)
trace4 = go.Scatter(x = df['Year'], 
                    y = df['LinkedIn'], 
                    mode = 'lines + markers', 
                    name = 'LinkedIn', 
                    marker = dict(color = 'darkblue'),
                   connectgaps=True)
trace5 = go.Scatter(x = df['Year'], 
                    y = df['Twitter'], 
                    mode = 'lines + markers', 
                    name = 'Twitter', 
                    marker = dict(color = 'lightblue'),
                   connectgaps=True)
trace6 = go.Scatter(x = df['Year'], 
                    y = df['Snapchat'], 
                    mode = 'lines + markers', 
                    name = 'Snapchat', 
                    marker = dict(color = 'yellow'),
                   connectgaps=True)
trace7 = go.Scatter(x = df['Year'], 
                    y = df['YouTube'], 
                    mode = 'lines + markers', 
                    name = 'YouTube', 
                    marker = dict(color = 'red'),
                   connectgaps=True)
trace8 = go.Scatter(x = df['Year'], 
                    y = df['WhatsApp'], 
                    mode = 'lines + markers', 
                    name = 'WhatsApp', 
                    marker = dict(color = 'green'),
                   connectgaps=True)
trace9 = go.Scatter(x = df['Year'], 
                    y = df['Reddit'], 
                    mode = 'lines + markers', 
                    name = 'Reddit', 
                    marker = dict(color = 'orange'),
                   connectgaps=True)
trace10 = go.Scatter(x = df['Year'], 
                    y = df['TikTok'], 
                    mode = 'lines + markers', 
                    name = 'TikTok', 
                    marker = dict(color = 'black'),
                    connectgaps=True)
trace11 = go.Scatter(x = df['Year'], 
                    y = df['Nextdoor'], 
                    mode = 'lines + markers', 
                    name = 'Nextdoor', 
                    marker = dict(color = 'lightgreen'),
                    connectgaps=True)

new_Layout = go.Layout(title = 'Totaal gebruik verschillende sociale media door bevolking Verenigde Staten',
                      xaxis = dict(title = 'Jaartallen', tickmode='linear', dtick = 'M12', gridcolor = 'lightgray'),
                      yaxis = dict(title = 'Percentage gebruik sociale media', tickformat = ',.0%', range = [0, 1], gridcolor = 'lightgray'),
                      font = dict(family = 'Georgia', color = 'Black'),
                      plot_bgcolor = 'white',
                      paper_bgcolor = 'white')
new_fig = go.Figure(data = [trace1, trace2, trace3, trace4, trace5, trace6, trace7, trace8, trace9, trace10, trace11], 
                    layout = new_Layout)
    
new_fig.add_annotation(
    xref="paper", yref="paper",
    x=0.5, y=-0.22,
    text="Op de x-axis is de tijd in jaren te zien. Op de y-axis is het percentage sociale media gebruikers te zien dat van<br> een bepaalt platform gebruik maakt. Hieruit is af te leiden dat elk sociaal platform door de jaren heen steeds meer wordt gebruikt.",
    showarrow=False,
)
    
new_fig.show()

Uitleg en preprocessing datasets¶

Elke uitleg geldt voor de dataset die eronder wordt beschreven¶

Dataset 1¶

Uitleg: Deze dataset van het CBS (Centraal Bureau van Statistiek) (CBS, 2022) gaat over het welzijn van jongeren. De variabelen zijn: 'Category', 'Tevredenheid, 18 jaar of ouder', Tevredenheid, 18 tot 25 jaar', 'Geluk, 18 jaar of ouder', 'Geluk, 18 tot 25 jaar'. Category geeft het jaartal aan waarvan de data zijn opgenomen. De andere variabelen geven het percentage aan van de Nederlandse bevolking en jongvolwassenen dat zich zo voelt. De dataset is te downloaden op cbs.nl.

Preprocessing: Om deze dataset te gebruiken hoefde er niet enorm veel aan de dataset aangepast te worden. Het enige wat wel moest veranderen was dat de getallen er eerst als percentages instonden, waardoor python het niet herkende als een integer, maar als een string. Nadat dit was aangepast naar de getallen die equivalent zijn aan die percentages kon de dataset gebruikt worden voor een lijngrafiek die over tijd laat zien hoe de groepen zich voelen.

In [15]:
gl
Out[15]:
Category Tevredenheid, 18 jaar of ouder Tevredenheid, 18 tot 25 jaar Geluk, 18 jaar of ouder Geluk, 18 tot 25 jaar
0 1997 0.841 0.848 0.882 0.911
1 1998 0.854 0.849 0.890 0.909
2 1999 0.848 0.846 0.884 0.898
3 2000 0.858 0.855 0.891 0.908
4 2001 0.859 0.857 0.893 0.909
5 2002 0.844 0.814 0.880 0.887
6 2003 0.845 0.846 0.878 0.907
7 2004 0.843 0.841 0.878 0.906
8 2005 0.839 0.828 0.874 0.876
9 2006 0.844 0.850 0.888 0.905
10 2007 0.849 0.872 0.882 0.898
11 2008 0.858 0.865 0.887 0.914
12 2009 0.851 0.846 0.890 0.900
13 2010 0.838 0.847 0.877 0.888
14 2011 0.847 0.850 0.881 0.894
15 2012 0.851 0.858 0.890 0.904
16 2013 0.836 0.856 0.875 0.900
17 2014 0.846 0.826 0.879 0.896
18 2015 0.839 0.862 0.874 0.887
19 2016 0.852 0.855 0.883 0.885
20 2017 0.854 0.853 0.875 0.875
21 2018 0.857 0.838 0.877 0.858
22 2019 0.873 0.861 0.889 0.875
23 2020 0.848 0.814 0.868 0.838
24 2021 0.836 0.769 0.864 0.809

Dataset 2¶

Uitleg: De volgende dataset is een mix van de dataset van Pewresearch die het sociale media gebruik per leeftijdsgroep aangeeft, en de dataset die het geluk en tevredenheid van zowel jongvolwassenen als de hele bevolking weergeeft (Demographics of Social Media Users and Adoption in the United States, 2023). Van de eerstgenoemde is de volgende data gebruikt: het percentage 18 tot en met 29-jarigen die sociale media gebruikt over de jaren heen. Van de laatstgenoemde is de volgende data gebruikt: het geluksgevoel van 18 tot en met 25-jarigen over de jaren heen (CBS, 2022). De periode van tijd die hiervoor is gebruikt is gedaan vanaf het begin van de laatstgenoemde, omdat er dan ook een zichtbaar verschil te zien is tussen het geluksgevoel van de tijd voor en na sociale media. De dataset bevat de variabelen: 'Category', 'Geluk, 18 tot 25 jaar', '18-29'. Het variabele 'Category' geeft het jaar aan waarvan de data zijn opgenomen. De andere variabelen geven het percentage van de leeftijdsgroepen aan dat zich zo voelt. De datasets zijn te downloaden op pewresearch.org en cbs.nl.



**Preprocessing:** Deze dataset is gemaakt in een zelfgemaakte csv file. De data die erin staat komt precies overeen met de data van de twee datasets die hiervoor zijn gebruikt. Het enige wat niet overeenkomt is de data van de tweede kolom, omdat er bij die dataset van de jaren 2005 en 2008 t/m 2013 meerdere datapunten waren in die jaren. Om deze reden is van die jaren een gemiddelde genomen en in deze dataset gezet. Verder werkt de dataset naar behoren.
In [16]:
cr
Out[16]:
Category Geluk, 18 tot 25 jaar 18-29
0 1997 0.911 NaN
1 1998 0.909 NaN
2 1999 0.898 NaN
3 2000 0.908 NaN
4 2001 0.909 NaN
5 2002 0.887 NaN
6 2003 0.907 NaN
7 2004 0.906 NaN
8 2005 0.876 0.115
9 2006 0.905 0.410
10 2007 0.898 NaN
11 2008 0.914 0.638
12 2009 0.900 0.717
13 2010 0.888 0.777
14 2011 0.894 0.805
15 2012 0.904 0.845
16 2013 0.900 0.877
17 2014 0.896 0.840
18 2015 0.887 0.900
19 2016 0.885 0.860
20 2017 0.875 NaN
21 2018 0.858 0.880
22 2019 0.875 0.900
23 2020 0.838 NaN
24 2021 0.809 0.840

Dataset 3¶

Uitleg: Deze dataset van Pewresearch (Demographics of Social Media Users and Adoption in the United States, 2023) geeft weer hoeveel procent van de bevolking van de Verenigde Staten sociale media gebruikt. Dit geven ze aan in verschillende leeftijdsgroepen, namelijk: 18-29, 30-49, 50-64, 65+. De data zijn om een bepaald aantal maanden/jaren opgenomen en dit wordt in de variabele 'Year' laten zien. De leeftijdsgroepen zijn de andere variabelen en deze laten zien hoeveel van een bepaalde leeftijdsgroep sociale media gebruikt. Dit wordt aangegeven in percentages. De datasets zijn te downloaden op pewresearch.org.



**Preprocessing:** Voor deze dataset hoefden alleen de percentage tekens achter de getallen weggehaald te worden. Hierna zijn de percentages equivalent gezet aan hun numerieke waarden. Toen kon de dataset worden gebruikt.
In [17]:
dc
Out[17]:
Year 18-29 30-49 50-64 65+
0 2005-03-21 0.07 0.06 0.04 0.03
1 2005-12-08 0.16 0.09 0.05 0.02
2 2006-08-31 0.41 0.06 0.03 0.00
3 2008-05-11 0.60 0.21 0.07 0.02
4 2008-08-10 0.65 0.27 0.10 0.03
5 2008-08-31 0.68 0.27 0.09 0.02
6 2008-12-04 0.67 0.30 0.12 0.02
7 2008-12-20 0.59 0.28 0.08 0.03
8 2009-04-19 0.70 0.42 0.20 0.05
9 2009-09-14 0.67 0.44 0.21 0.06
10 2009-12-27 0.78 0.47 0.25 0.08
11 2010-01-19 0.76 0.51 0.26 0.07
12 2010-05-30 0.82 0.53 0.37 0.11
13 2010-09-13 0.80 0.52 0.31 0.09
14 2010-11-24 0.74 0.54 0.33 0.11
15 2010-11-28 0.78 0.54 0.33 0.14
16 2010-12-21 0.76 0.55 0.36 0.12
17 2011-05-22 0.79 0.61 0.38 0.14
18 2011-08-26 0.82 0.59 0.36 0.12
19 2012-02-19 0.81 0.64 0.39 0.16
20 2012-08-07 0.88 0.68 0.48 0.22
21 2013-05-19 0.87 0.72 0.50 0.24
22 2013-07-14 0.87 0.72 0.49 0.21
23 2013-09-30 0.89 0.74 0.54 0.27
24 2014-01-26 0.84 0.77 0.52 0.27
25 2015-07-12 0.90 0.77 0.51 0.35
26 2016-11-06 0.86 0.80 0.64 0.34
27 2018-01-10 0.88 0.78 0.64 0.37
28 2019-02-07 0.90 0.82 0.69 0.40
29 2021-02-08 0.84 0.81 0.73 0.45

Dataset 4¶

Uitleg: De dataset van businessofapps (Dating App Revenue and Usage Statistics (2023) - Business of Apps, 2023) gaat over het totaal aantal gebruikers van datingsapps. Het gaat hierbij om de cijfers van alle populaire datingapps bij elkaar, met in de hoofdrol apps als Tinder, Badoo en Bumble. De variabele zijn 'Jaar' en 'Gebruikers(mm)'. De jaar variabele geeft weer in welk jaar de data zich afspeelt, de gebruikers(mm) hoeveel totaal gebruikers alle datingapps hebben, de gebruikers staan uitgedrukt in miljoenen (mm). De dataset is te downloaden op businessofapps.com

Preprocessing: De dataset van businessofapps moest een klein proces ondergaan. Dit proces was het omzetten naar .csv aangezien de website alleen de grafiek (met exact getallen) weergaf. Deze data zijn uitgetypt en omgezet in een csv file om het zo in te kunnen laden.

In [18]:
app
Out[18]:
Jaar Gebruikers(mm)
0 2015 198.6
1 2016 217.5
2 2017 240.9
3 2018 250.5
4 2019 283.5
5 2020 293.7
6 2021 323.9
7 2022 337.3

Dataset 5¶

Uitleg: De dataset van ipsos (Newall, 2018) gaat over cyberbullying in 28 verschillende landen. De variabelen zijn: 'Country', '2018', '2016', '2011', 'Code'. Country geeft het land aan. 2018 t/m 2011 de data van die jaartallen en code geeft een afkorting van de namen van de landen aan. De dataset is op ipsos.com te downloaden.

Preprocessing: Om de data te kunnen gebruiken was het vereist om de data om te zetten naar een .csv bestand. De originele data bestaan uit een aantal variabelen, namelijk de naam van het land en de percentages van drie verschillende jaren. Om de homogeniteit van de datastory te behouden zijn alle landen naar het Nederlands vertaald. Verder is er voor elk land de bijbehorende landcode toegevoegd. Op deze wijze kon de data op een choropletenkaart gezet worden.

In [19]:
bully
Out[19]:
Country 2018 2016 2011 Code
0 India 37 32 32 IND
1 Brazilië 29 19 20 BRA
2 Verenigde Staten 26 34 15 USA
3 België 25 13 12 BEL
4 Zuid-Afrika 26 25 10 ZAF
5 Maleisië 23 -- -- MYS
6 Zweden 23 20 14 SWE
7 Canada 20 17 18 CAN
8 Turkije 20 14 5 TUR
9 Saudi-Arabië 19 17 18 SAU
10 Australië 19 20 13 AUS
11 Mexico 18 20 8 MEX
12 Verenigd Koninkrijk 18 15 11 GBR
13 China 17 20 11 CHN
14 Servië 16 -- -- SRB
15 Duitsland 14 9 7 DEU
16 Argentinië 14 10 9 ARG
17 Peru 14 13 -- PER
18 Zuid-Korea 13 9 8 KOR
19 Italië 12 11 3 ITA
20 Polen 12 18 12 POL
21 Roemenië 11 -- -- ROU
22 Hongarije 10 11 7 HUN
23 Spanje 9 10 5 ESP
24 Frankrijk 9 7 5 FRA
25 Chili 8 -- -- CHL
26 Japan 5 7 7 JPN
27 Rusland 1 9 5 RUS

Dataset 6¶

Uitleg: De volgende dataset van het CBS (CBS Dataportaal, z.d.) geeft het aantal banen weer van werknemers die tot maximaal 130% van het voor zijn of haar leeftijd geldende wettelijk minimumloon of minder verdienen. De dataset bevat een aantal variabelen. 'KenmerkenWerknemer' geeft een code aan waarmee aangegeven wordt wat voor type persoon het is, bijvoorbeeld man of vrouw of de leeftijd. 'CaoSector' geeft een code aan die aangeeft in welke sector de cao zit. De 'Perioden' kolom betreft het jaartal. 'TotaalBanen_1' geeft het totale aantal banen in een bepaald jaar aan. Deze dataset is te downloaden op cbs.nl.

Preprocessing: De dataset was vrij eenvoudig om te verkregen. Met de website van het CBS konden er namelijk al variabelen gefilterd worden. De originele dataset is namelijk vrij groot, waarbij veel data niet specifiek relevant is voor het argument. Zo kon er via de website variabelen zoals minimumloon, geslacht, leeftijd en nationaliteit gefilterd worden.

In [20]:
werk
Out[20]:
ID KenmerkenWerknemer CaoSector Perioden TotaalBanen_1
0 0 T001006 T001020 2009 7818.7
1 1 T001006 T001020 2010 7859.8
2 2 T001006 T001020 2011 7926.8
3 3 T001006 T001020 2012 7872.1
4 4 T001006 T001020 2013 7745.8
5 5 T001006 T001020 2014 7706.0
6 6 T001006 T001020 2015 7782.5
7 7 T001006 T001020 2016 7892.5
8 8 T001006 T001020 2017 8096.0
9 9 T001006 T001020 2018 8324.2
10 10 T001006 T001020 2019 8500.5
11 11 T001006 T001020 2020 8390.8
12 12 T001006 T001020 2021 8561.0

Dataset 7¶

Uitleg: De dataset van Pewresearch (Demographics of Social Media Users and Adoption in the United States, 2023) die voor de visualisatie hieronder is gebruikt, laat per een aantal maanden het percentage van de bevolking van de Verenigde Staten zien die verschillende sociale media hebben gebruikt. Dit wordt aangegeven in percentages. De variabelen zijn: 'Year', 'Facebook', Pinterest', 'Instagram', 'LinkedIn', 'Twitter', 'Snapchat', 'YouTube', 'WhatsApp', 'Reddit', 'TikTok', 'Nextdoor'. Het variabele 'Year' geeft de datum aan waarvan de data zijn opgenomen. De andere variabelen geven aan hoeveel procent van de sociale mediagebruikers dat specifieke platform gebruikt. De dataset is te downloaden op pewresearch.org.



**Preprocessing:** Voordat de dataset gebruikt kon worden moest er enorm veel worden opgeschoond. Er stond namelijk tekst in de csv file waardoor de file in eerste instantie niet gelezen kon worden en de komma's stonden op de verkeerde plek. Ook stonden er enorm veel   waardes in. Deze moesten aangepast worden naar NaN's zodat deze gebruikt konden worden. Verder moest ook het kolom 'Year' worden aangepast naar een format waardoor het naar een daadwerkelijke datum om kon zetten en op die manier makkelijker te gebruiken was voor de x-as.
In [21]:
df
Out[21]:
Year Facebook Pinterest Instagram LinkedIn Twitter Snapchat YouTube WhatsApp Reddit TikTok Nextdoor
0 2012-08-05 0.54 0.10 0.09 0.16 0.13 NaN NaN NaN NaN NaN NaN
1 2012-08-07 NaN NaN NaN 0.14 NaN NaN NaN NaN NaN NaN NaN
2 2012-12-09 NaN 0.13 0.11 0.13 NaN NaN NaN NaN NaN NaN NaN
3 2012-12-16 0.57 NaN NaN NaN NaN NaN NaN NaN NaN NaN NaN
4 2013-05-19 NaN NaN NaN 0.15 NaN NaN NaN NaN NaN NaN NaN
5 2013-07-14 NaN NaN NaN 0.16 NaN NaN NaN NaN NaN NaN NaN
6 2013-09-16 0.57 0.17 0.14 0.17 0.14 NaN NaN NaN NaN NaN NaN
7 2013-09-30 NaN NaN NaN 0.16 NaN NaN NaN NaN NaN NaN NaN
8 2014-01-26 NaN NaN NaN 0.16 NaN NaN NaN NaN NaN NaN NaN
9 2014-09-21 0.58 0.22 0.21 0.23 0.19 NaN NaN NaN NaN NaN NaN
10 2015-04-12 0.62 0.26 0.24 0.22 0.20 NaN NaN NaN NaN NaN NaN
11 2016-04-04 0.68 0.26 0.28 0.25 0.21 NaN NaN NaN NaN NaN NaN
12 2018-01-10 0.68 0.29 0.35 0.25 0.24 0.27 0.73 0.22 NaN NaN NaN
13 2019-02-07 0.69 0.28 0.37 0.27 0.22 0.24 0.73 0.20 0.11 NaN NaN
14 2021-02-08 0.69 0.31 0.40 0.28 0.23 0.25 0.81 0.23 0.18 0.21 0.13

Reflectie¶

Onze eerste proposal werd positief ontvangen, er werd ons verteld dat ons standpunt al goed was. Bij het inleveren van de draftversie hadden we de datastory gedeeltelijk af. Wederom was deze feedback ook vrij positief, met een aantal kleine verbeterpunten. De visualisaties moesten meer interactie bevatten, en ook nog duidelijker gebonden worden aan onze argumentaties. Deze feedback gingen we implementeren.

We hebben de interacties werkende gemaakt, en toen de argumentaties gebonden aan externe bronnen en logische verbanden getrokken. Hiermee probeerde we zo goed mogelijk de gegeven feedback te implementeren.

We kwamen uiteindelijk uit op 4 argumenten voor ons negatieve perspectief, en 2 argumenten voor ons positieve perspectief. Uiteindelijk blijft het lastig om een haakse stelling helemaal eerlijk te verdelen, omdat er toch vaak een overwinnende kant is (er is natuurlijk maar één waarheid).

Werkverdeling¶

  • Introductie: Lex
  • Argumenten:
    • Argument 1:
      • Visualisatie: Simon
      • Geschreven: Chen
      • Bedacht: Chen, Simon
    • Argument 2:
      • Visualisatie: Simon
      • Geschreven: Chen
      • Bedacht: Chen
    • Argument 3:
      • Visualisatie: Lex
      • Geschreven: Lex
      • Bedacht: Lex
    • Argument 4:
      • Visualisatie: Chen
      • Geschreven: Chen
      • Bedacht: Chen
    • Argument 1:
      • Visualisatie: Simon
      • Geschreven: Lex
      • Bedacht: Chen
    • Argument 2:
      • Visualisatie: Simon
      • Geschreven: Chen
      • Bedacht: Chen
  • Uitleg en preprocessing:
    • Dataset 1: Simon
    • Dataset 2: Simon
    • Dataset 3: Simon
    • Dataset 4: Lex, Simon
    • Dataset 5: Chen, Simon
    • Dataset 6: Chen
    • Dataset 7: Simon
  • Perspectieven: Lex
  • Reflectie: Chen, Lex, Simon
  • Werkverdeling: Simon
  • Referentielijst: Chen, Simon

Referentielijst¶

  • CBS, & Coumans, M. C. (2022, 9 november). Welzijn van jongvolwassenen - Jaarrapport Landelijke Jeugdmonitor 2022. Welzijn van jongvolwassenen - Jaarrapport Landelijke Jeugdmonitor 2022 | CBS. https://longreads.cbs.nl/jeugdmonitor-2022/welzijn-van-jongvolwassenen/

  • Davis, J. A., Wolff, H., Forret, M. L., & Sullivan, S. E. (2020). Networking via LinkedIn: An examination of usage and career benefits. Journal of Vocational Behavior, 118, 103396. https://doi.org/10.1016/j.jvb.2020.103396

  • Demographics of Social Media Users and Adoption in the United States. (2022, 7 april). Pew Research Center: Internet, Science & Tech. https://www.pewresearch.org/internet/fact-sheet/social-media/?tabId=tab-81867c91-92ad-45b8-a964-a2a894f873ef

  • Elhai, J. D., Yang, H., & Montag, C. (2021). Fear of missing out (FOMO): overview, theoretical underpinnings, and literature review on relations with severity of negative affectivity and problematic technology use. Brazilian Journal of Psychiatry, 43(2), 203–209. https://doi.org/10.1590/1516-4446-2020-0870

  • Garett, R., Lord, L., & Young, S. D. (2016). Associations between social media and cyberbullying: a review of the literature. mHealth, 2, 46. https://doi.org/10.21037/mhealth.2016.12.01

  • Holtzhausen, N., Fitzgerald, K. C., Thakur, I., Ashley, J., Rolfe, M., & Pit, S. W. (2020). Swipe-based dating applications use and its association with mental health outcomes: a cross-sectional study. BMC Psychology, 8(1). https://doi.org/10.1186/s40359-020-0373-1

  • Keles, B. Y., McCrae, N., & Grealish, A. (2020). A systematic review: the influence of social media on depression, anxiety and psychological distress in adolescents. International journal of adolescence and youth, 25(1), 79–93. https://doi.org/10.1080/02673843.2019.1590851

  • Kohler, S., & Dietrich, T. (2021). Potentials and Limitations of Educational Videos on YouTube for Science Communication. Frontiers in Communication, 6. https://doi.org/10.3389/fcomm.2021.581302

  • Myers, T. A., & Crowther, J. H. (2009). Social comparison as a predictor of body dissatisfaction: A meta-analytic review. Journal of Abnormal Psychology, 118(4), 683–698. https://doi.org/10.1037/a0016763

  • Newall, M. N. (2018). Cyberbullying: A Global Advisor Survey. Ipsos Public Affairs.

  • Sheldon, K. M., Abad, N., Ferguson, Y. L., Gunz, A., Houser-Marko, L., Nichols, C. D., & Lyubomirsky, S. (2009). Persistent pursuit of need-satisfying goals leads to increased happiness: A 6-month experimental longitudinal study. Motivation and Emotion, 34(1), 39–48. https://doi.org/10.1007/s11031-009-9153-1

  • Werkgelegenheid en minimumloon; kenmerken werknemer, cao-sector. (2022, 25 november). opendata.cbs. https://opendata.cbs.nl/statline/portal.html?_la=nl&_catalog=CBS&tableId=81487ned&_theme=16

In [ ]: